یکپارچه سازی اطلاعاتچکیدهدر فصل 9، ما به بررسی استخراج اطلاعات از صفحات وب پرداختیم. اطلاعات استخراج شده در جداول قرار داده می شود. برای کاربرد، به هر حال، کافی نیست تا اطلاعات را تنها از یک سایت خاص استخراج کنیم. در عوض اطلاعات حاصل از تعداد زیادی از سایت ها به منظور ایجاد خدمات ارزش افزوده جمع آوری می گردد. در چنین مواردی استخراج تنها بخشی از این داستان می باشد. بخش دیگر یکپارچه سازی اطلاعات استخراج شده برای ایجاد یک پایگاه اطلاعاتی منسجم و پایدار می باشد زیرا سایت های مختلف معمولا از فرمت های اطلاعاتی متفاوتی استفاده می کندد. به طور طبیعی، یکپارچه سازی به معنی انطباق ستون ها در جداول اطلاعاتی مختلف می باشد که حاوی انواع اطلاعات مشابهی می باشند ( به عنوان مثال نام محصول) و منطبق با ارزش هایی می باشند که از نقطه نظر معنایی مشابه بوده اما در وب سایت های مختلف به طور متفاوتی نشان داده می شوند ( برای نمونه ( کوک و کوکاکولا). متاسفانه پژوهش های یکپارچه محدودی تا به حال در این زمینه خاص انجام شده است. بسیاری از تحقیقات یکپارچه سازی اطلاعات وب تمرکزش را نبر روی یکپارچه سازی رابط های جستجوگری وب قرار داده است. این فصل دارای چندین بخش در ارتباط با یکپارچگی این موارد می باشد. به هر حال بسیاری از ایده های ایجاد شده برای یکپارچه سازی اطلاعات استخراجی کاربردی می باشند زیرا مشکلات مشابه هستند